查看原文
其他

集智俱乐部学术年会:5场主题报告+3场分论坛,一起因果纠缠!

集智俱乐部 集智俱乐部 2022-04-08

导语


2020年,我们第一次尝试在全球范围内利用精细的个人数据和数据科学来帮助提升社会系统的稳健性与适应性,从而适应与新冠疫情共存的世界。数字化、智能化进程再度加速的今天,集智俱乐部联合智源社区,邀请北京大学公共卫生学院生物统计系主任周晓华,清华大学计算机科学与技术系副教授崔鹏与北京师范大学系统科学学院教授张江,匹兹堡大学助理教授吴令飞等众多学者进行分享,同时还有共同开因果推荐系统、图网络与时序数据网络、理解复杂性、高中生专场等不同主题的分享,与大家一起面对面分享对交叉学科的最新探索及对复杂系统的最新见解。一年一度的集智学术年会将于2021年1月3日(周日)在北京举办,让我们一起加入发生在数据科学与人工智能领域的因果革命,探索因果纠缠的复杂社会!


同时,我们呼唤天使投资赞助与合作,期待您与我们一起建设“没有围墙的研究所”!


扫描海报二维码,即可付费报名






五场报告分享:

1.崔鹏 | 稳定学习:发掘因果推理和机器学习的共同基础

2.周晓华 | 因果推断在医疗中的应用

3.吴令飞 | 创新的未来: 如何在智能时代评估和加速创新

4.李睿琪 | 共享单车系统中标度律的涌现

5.李周园 | 生物多样性与稳定性的跨尺度研究


三场分论坛:
1.因果推荐系统
2.图网络与时空预测
3.理解复杂性





主场分享




稳定学习:发掘因果推理和机器学习的共同基础



近年来,随着人工智能技术的应用研究进入了「深水区」,暴露出现有的机器学习学习方法存在许多的风险和短板。如何开发对数据变化具有稳定性和鲁棒性的学习模型,对于学术研究和实际应用都是至关重要的。因果推断是一种强有力的统计建模工具,用于解释和稳定学习。在这次分享中,崔鹏老师着重于因果推理和稳定学习,旨在从观察数据中探索因果知识,以提高机器学习算法的解释性和稳定性。

个人简介:崔鹏,清华大学副教授,研究方向包括大数据环境下的因果推理与稳定预测、网络表征学习,及其在金融科技、智慧医疗及社交网络等场景中的应用。

因果推断在医疗中的应用



自从奥巴马启动精准医疗计划,精准医疗这个词就站到了风口,备受瞩目。精准医疗是一种将个人基因、环境与生活习惯差异考虑在内的疾病预防与治疗的新兴方法,其涉及的两个主要因果问题是异质性的治疗效果估计和个体化治疗方案选择。在这个讲座里, 周晓华老师将介绍潜在结果模型和结构方程模型框架,相关数学概念和工具。并且介绍如何解决生物医学中因果推理的一些问题,例如非依从性,死亡截断,混淆控制,因果中介分析和缺失数据等问题。

个人简介:周晓华,北京大学公共卫生学院生物统计系主任,研究方向是缺失数据,因果推断分析,大数据分析,半参数模型, 医学检验卫生经济,卫生服务领域发展新的统计方法。

创新的未来: 如何在智能时代评估和加速创新



人类社会从简单到复杂的进程中,伴随着一系列的创新。今天,创新被视作社会发展乃至维持社会运转的重要动力。在我们不断感叹“内卷”的同时,背后体现的可能是当前创新速度不足以维持社会的快速发展这一窘境。我们不禁要问,科学的发展、技术的进步和经济的繁荣是否受到人类创新能力的限制?如果答案是肯定的,那么又是什么限制了人的创造力,我们有可能通过设计(Design)集体智能及机器智能来释放它吗? 为了获取可以用来指导未来创新研究、政策和商业战略的洞见,我们回顾了创新的最新研究进展,重点对知识融合导致的创新瓶颈进行了研究。

个人简介:吴令飞,匹兹堡大学助理教授,对如何衡量科学技术的创新,发现有效的团队机制以加速创新,设计AI工具以实现自动化创新感兴趣。

共享单车系统中标度律的涌现



人类移动的基本规律在城市研究中是非常重要的研究问题,但是运输工具与乘客之间的移动模式规律却少有研究,这样的问题在共享经济时代却非常关键。通过对无桩自行车共享系统记录每次出行的详细信息进行分析,为我们揭示隐藏在出行背后的行为模式,存在普遍的标度行为,为共享经济下的绿色出行有积极的指导意义。

个人简介:李睿琪,北京化工大学信息科学与技术学院副教授,城市网络实验室主任,主要研究方向为城市大数据分析与建模、复杂网络研究与流行病传播动力学。


生物多样性与稳定性的跨尺度研究



“生物多样性与稳定性跨尺度研究:从物种到群落”(Biodiversity and stability across scales: from species to community),本报告将从生态学中多样性与稳定性关系的经典思辨出发,根据物种观测数据的实证分析,讨论群落稳定性的驱动因素,展示种群随空间尺度变化的稳定化规律,分享多样性与生态系统功能关联机制的新理解。

个人简介:李周园,北京林业大学讲师,研究方向是遥感与地理信息学应用、土地利用和气候变化、生物多样性与生态系统功能。






分论坛一:
因果推荐系统专题




1.内容背景介绍


在智能时代初期,我们接触着各种各样的推荐系统。如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接。本质上,推荐是信息提取的一种特殊形式,它利用过去的行为和用户相似性来生成一系列根据最终用户的喜好量身定制的信息。这使得推荐系统可以更有效率的连接用户与内容和服务,从而节约了大量的时间和成本。

推荐系统的任务很多时候本质上是要回答一个因果问题,例如如果我们“强迫”用户去看电影,评分会是多少? 目前工业界回答此问题的主要工具是 A/B 测试,考虑到其昂贵的价格和回答问题的局限性质,工业界有强烈的使用观测数据回答因果问题的需求,使用因果推理 Debias 成为了一个非常 Promising 的方向。本次分论坛围绕Causal  debias 进行,我们将从问题出发,探索设计合适的统计指标及其估计方法评估推荐系统存在的 Bias,使用因果信息优化推荐系统中的召回和排序算法。

2.分享流程及介绍


  • 董振华:推荐系统模型的运用及挑战



分享主题简介:推荐系统是人工智能和大数据商业运用中最重要的技术之一,它被广泛应用于社交媒体、网购平台、短视频平台、移动浏览器等的信息流和广告系统中。本次分享将介绍当前推荐系统使用的主要技术模型,以及这种面向数据关联建模的技术模型可能存在的偏执挑战和可解释性问题,最后,我们还将探讨在因果启发下,对上述问题的解决方案。

个人简介:董振华,现任华为诺亚方舟实验室技术专家,负责推荐系统、机器学习前沿技术的研究与落地,帮助华为多个产品构建推荐系统,包括:华为浏览器,华为应用市场,广告系统,负一屏信息流与服务直达,金融产品推荐系统等,研究方向:推荐系统,信息检索,因果推理,反事实学习。


  • 邹昊:运用混淆变量平衡实现稳定学习



分享主题简介:现如今,机器学习技术在许多领域都取得了卓越的成绩。但可解释性、稳定性还是目前机器学习尚未充分解决的问题和困境。而这两个问题之所以存在,是因为现有的大多数机器学习模型都以不可解释、不稳定的关联统计为基础。因此,我们在机器学习中尝试与因果科学相结合,力图达到稳定学习的目标。本次分享将介绍以混淆变量平衡为基础的因果效应估计,以及如何将这种思想引入到机器学习中实现稳定学习。

问题大纲:
稳定学习在推荐系统等业界有哪些应用和结合点。
稳定学习从因果分析的角度有哪些更深入的分析和解读。

个人简介:邹昊,清华大学计算机科学与技术系三年级在读博士生,导师崔鹏。研究方向为因果推理和反事实学习。

  • 吴鹏:非参/半参统计在推荐系统中的运用



分享主题简介:我们如要要在观察性研究中进行因果推断,通常的做法是将倾向性得分的倒数作为权重剔除混杂。但是当倾向性得分的值接近0或1时,最终的估计将会非常不稳定。本次分享将介绍,当允许倾向性得分的值接近0或1时,如何用最少的模型假定(半参或非参),估计出感兴趣的因果参数,探讨如何将这种方法应用于推荐系统与机器学习中。

问题大纲:
  • 推荐系统的评价标准。

  • 推荐系统中各种bias的形式化定义。

  • 推荐系统中的因果框架。

  • 推荐系统中如何处理由于倾向性得分的值接近0或1时导致方差过大的问题。

  • 推荐系统中如何结合少量的随机化试验数据(uniform data)和大量的观察性数据消除bias。

  • Rerandomization与稳定学习的联系。

    个人简介:吴鹏,北京大学博士后。研究方向是因果推断、非参/半参统计 已发表论文10+篇 。

    3.主题讨论


    1. 我们对推荐系统的期待

    2. 具备因果知识和推理能力的推荐系统如何实现






    分论坛二:

    图网络与时序数据网络专题




    1.内容背景介绍


    图神经网络已经成为深度学习领域最热门的方向之一,在自然语言处理/计算机视觉/推荐系统等领域都得到了广泛的应用。但是,当前图神经网络的研究主要针对由相同类型节点和边构成的同质图。然而,在现实生活中的图数据往往是由多种类型的节点和边构成的异质图,因此其更符合实际工业应用的需求。如何设计异质图神经网络架构并在实际工业场景下进行实际应用是一个迫切需要解决的问题。本次分论坛,我们将通过时空数据挖掘、异质图神经网络等的模型构建和现实应用来理解社会中的结构和关系。

    2.分享流程及介绍


    • 王寰东:时空数据挖掘与用户隐私保护


    分享主题简介:近些年随着国家城镇化战略的实施,大城市、城市群飞速发展,带来了交通、环境等一系列城市问题。究其根源,是我们对城市运转的本质理解不够,对其发展规律把控不足。城市大数据为我们研究其规律提供了宝贵的机会,然而当我们想用数据驱动的方法来解决城市问题的时候,却很面临着数据质量参差不起、多源数据天然分离等问题。针对以上问题,我们研发了一系列智能时空数据增强技术,实现了从局部数据恢复出全局数据、从低分辨率数据估计出高分辨率数据、基于多域分离数据形成跨域融合数据,实现了从小数据到城市大数据的跨越。基于这些数据,我们实现了从个体层面到群里层面的用户时空移动规律建模,并且研究了其中的隐私保护问题。

    个人简介:王寰东是清华大学电子工程系的博士后研究员,他分别于2014年和2015年在清华大学获得信息与通信工程学士学位和数学与应用数学第二学士学位,并于2019年在清华大学获得信息与通信工程博士学位。研究兴趣包括城市计算、移动大数据挖掘、强化学习。

    • 纪厚业:异质图神经网络及其在阿里推荐业务中的应用



    分享主题简介:图神经网络已经成为深度学习领域最热门的方向之一,在自然语言处理/计算机视觉/推荐系统等领域都得到了广泛的应用。但是,当前图神经网络的研究主要针对由相同类型节点和边构成的同质图。然而,在现实生活中的图数据往往是由多种类型的节点和边构成的异质图,因此其更符合实际工业应用的需求。如何设计异质图神经网络架构并在实际工业场景下进行实际应用是一个迫切需要解决的问题。本报告将介绍异质图神经网络以及在阿里巴巴分享推荐业务中的应用。

    个人介绍: 纪厚业,北京邮电大学GAMMA Lab在读博士生,阿里巴巴/微信 Research Intern。其研究方向包括 (异质) 图神经网络和推荐系统,在AAAI/WWW/EMNLP等顶会上发表多篇论文。论文总引用217,代表作HAN(引用179)作为异质图神经网络的经典架构被亚马逊DGL收录。担任AAAI/WSDM/ACL/IEEE Access审稿人,曾在中科院/蚂蚁金服/阿里达摩院/淘宝/华为做图神经网络技术分享。

    • 温浩珉:城市及末端揽配网络智能化实践—以揽件顺序预测为例


    分享主题简介:近年来电商行业的迅速发展对物流行业提出了更高的要求。我们将介绍城市及末端揽配网络的智能化场景,并简要我们在揽件顺序预测上的相关工作。揽件路径预测对于理解快递员派送行为,优化派单系统至关重要。该问题本质上是带有严格时空约束的排序问题,并且不同的快递员具有不同的决策偏好。针对以上问题,我们提出了一种深度神经网络模型,通过建模快递员历史行为,来学习快递员的决策经验和偏好。

    个人介绍:温浩珉,北京交通大学网络科学与智能系统研究所(INSIS)在读博士生(博二)。主要研究方向:时空数据挖掘。目前在顶会ICDE上发表论文一篇。

    • 林彦:上下文敏感的地点表示学习



    分享主题简介:在时空轨迹上对地点进行表示学习是一个非常重要的任务,能够帮助多种轨迹数据挖掘任务取得更佳的性能。在现实世界中,一个地点往往承载着多种功能,在不同的上下文环境中,用户访问一个地点的目的不同。然而,现有的地点表示学习方法通常为每个地点学习一条静态的嵌入向量,未考虑地点的动态多功能性特征。针对上述问题,我们提出了一种上下文敏感的地点表示学习方法,根据目标地点具体的上下文,动态地计算其表示。如此一来,地点的多功能特征能被更精准地融入其嵌入向量中。

    个人介绍:林彦,北京交通大学INSIS博士一年级生,研究方向为时空数据挖掘和表示学习。

    3.主题讨论


    1.图神经网络的问题与瓶颈。

    2.图神经网络下一步的发展。







    分论坛三:理解复杂性

    宇宙、生命、意识的思考与度量




    1.内容背景介绍


    人活一世,见天地,见众生,见自己。不断的想见、看见、证见中,我们会追问同一串问题:世界为什么会是复杂的?这复杂可以被认识吗?人自身可以被认识吗?

    走在不同道路上的我们,为回答这些共同的问题,进入到了复杂系统研究的领地。我们跟随系统研究的先行者,将视角从不同的研究热点中转移,从混沌,到耗散,到控制,到集群涌现,到幂律,到网络,到深度学习,到因果,到图网络……我们的研究对象各不相同,从量子,到天气,到经济,到社会,到城市,到智能机器,到游戏,到生命,到脑,到意识,到宇宙万物……我们惊奇于系统的自发、自组、自适应,迷惑于复杂性发展的有向性、自主性,我们希望理解、度量、模拟甚至重建这套神奇的系统。

    复杂性可以被认识吗?复杂性正在被认识,被破解,被攻陷,被挤压……这过程仍在继续,我们是见证者,也可能是参与者。我们可以重新思考和审视,我们口口声声的复杂性,还是不是“科学中涌现的综合”?大脑怎样认识和学习复杂性,怎样意识自身?我们是否能够通过理解而重现这一过程?物理世界与生命世界的演生,是否共享同一套复杂化和层次形成的规则,是否能够用同样的方法度量?自复制的机制是什么,主体是不是生命的起点?

    这是一群“老集智”的重聚,主讲的每一位,在集智社区中都有十年上下的经历。我们惊喜地发现,这十多年中,大家各自仍然思考和探索着最初的那些问题。就如同这期间的每一次遇见都是同样的感受:时间似乎从未流逝,我们只是转身去打了一杯咖啡,讨论又可以继续了。

    走了很远,回首相见,仍是当初那群硬核少年。

    理解复杂性,今天的你,来和我们一起玩吧~

    2.分享流程及介绍


    • 十三维:一个有关意识的闭包理论



    分享主题简介:
    大脑的信息处理过程可以在多个时空尺度上进行描述和分析,然而只有粗粒度在特定尺度上的信息似乎才能为意识知觉和利用。意识的信息闭包理论认为,意识过程是在某些粗粒度上对环境形成非平凡信息闭包(NTIC)的过程,该理论不仅对对意识内容和水平都提出了新的量化定义,对各种意识现象进行了解释和预测,还自然而然地调和了许多现有的意识理论。

    三维,某航企数据运营主管、集智俱乐部常驻作者,毕业于首都师范大学数学系,长期关注复杂系统与认知科学等跨学科研究。

    • 苑明理:用塞伦盖蒂游戏探索自然数的概念形成



    分享主题简介:
    在简单回顾数制历史和自然数的定义之后,提出了一个基于强化学习的场景,尝试从学习的视角重新考虑自然数的概念形成。

    苑明理,十余年程序员生涯,游走于工程、语言、知识、智能这些关键词之间,内心对世界充满很多好奇和困惑,尝听友人讲大刘《山》的故事,也期自己可凭蛮力,凿空厚壁,得见星空。

    • 王东:深度学习与科学发现的逻辑



    分享主题简介:
    科学发现能否自动化?仅仅依靠数据和算法能否得到新的科学发现,还是需要某些天才的灵光一现?这次分享的主题为深度学习与科学发现的逻辑,抛砖引玉,与大家一起探讨科学发现自动化这个问题。

    王东,科学哲学背景,关注智能与认知哲学。

    • 袁行远:从网络文学迈向世界模型



    分享主题简介:
    随着自然语言处理超大规模语料的新潮流兴起,神经网络语言模型还是一个魔改版统计模型吗?从天气预报到小说续写,世界运转的深层规律会隐藏在网络连接当中吗?语言模拟器可以作为强化学习智能体的策略函数吗?请欣赏2020年来自行远的无责脑洞

    袁行远:彩云科技CEO。

    • 玉德俊:基于 Avida 的自复制演变规律探索



    分享主题简介:
    1. 对自复制问题的简要介绍,其研究的历程和存在的主要问题。2. 人工生命avida平台以及基于avdia的自复制工作介绍  3. 推论和猜想。

    玉德俊,石油企业高级工程师,从事天然气与管道相关企业信息化工作,对人工智能、自复制系统研究感兴趣。‍

    • 王雄:主体性的起源思考 从粒子到复杂系统



    分享主题简介:
    一个由客观规律支配的世界是如何产生自由意志的?一个可能的方向是从粒子的模型到复杂系统的模型来理解宇宙构建的基础,我将系统回顾理论物理的粒子和场的概念,并畅想一个用系统来取代粒子和场的基础理论。

    王雄,集智科学家。从事复杂性科学与量化投资研究与教学。自大学时代起,一直坚持研究自然规律的统一性与复杂性两个科学的极致问题。

    • 小木球:前生命主体与二级涌现概念的探索



    分享主题简介:
    早期复杂性研究基于对混沌系统、耗散系统及集群系统的动力学分析,近年来集中于对网络与控制的理解。但对于生命这类多层次复杂系统,它的层级产生过程与物理世界是否共享同一套规则?我们将从自催化与前生命主体的关系,以及二级涌现概念的讨论中,重新审视复杂性研究中的涌现与层次生成问题。

    小木球,肿瘤分子遗传学博士,集智科学家,从事生物新药研发工作。曾在集智俱乐部组织过24期《失控》读书会,长期关注生命复杂性和生命起源问题。


    • 傅渥成:理解复杂系统的可理解性




    分享主题简介:
    爱因斯坦曾经说:「宇宙最不可理解之处,就在于它竟然是可理解的」,复杂系统也是如此。在复杂系统背后可能有简单的微观机制,又或者我们可以建立起关于系统的宏观唯象理论。为什么看似具有高自由度的复杂系统,往往可以被约简到较低的维度上?在讨论中,我将会结合统计物理(自旋玻璃)、生物进化(突变稳定性)、神经科学(神经可变性)和机器学习等领域的一些新进展,尝试对相关问题进行回答。

    傅渥成,南京大学物理系物理学博士,东京大学博士后,集智科学家,“知乎盐 Club 2014”荣誉会员,曾出版知乎盐系列电子书《写在物理边上》《临界:智能的设计原则》,知乎一小时电子书《能量守恒》,科普书籍《宇宙从何而来》,研究方向包括统计物理及其在生命科学问题中的应用等。

    3.主题讨论


    • 秩序的起源与复杂性:问题-工具-应用

    • 研究者与集智科学社区






      高中生专场




      今年的高中生专场依然由高中生冯睿洋进行策划、邀请到了几位她的高中生小伙伴们进行分享。

      高中生们分别就自己过去一年中做的小研究与自己对科研的理解和感悟,进行三到五分钟的项目分享。

      以下是分享者及大家分享的主题简介:

      兰正阳,一个因自己受惠于社会结构性不公而心怀愧怍的北京高中生;
      带来的分享主题是“在一个注定不公平的社会前,学生们应该学会什么?”。

      李韵韵,梦想是Debug the World的心理学爱好者,科学与技术是她与世界沟通的语言;

      郭宇泽,期望将科学技术与心理知识结合,于理性和感性间与世界沟通;

      她们带来的分享主题是“肢体语言对人类情绪感受的影响”。

      王禹衡,加拿大高中11年级在读,喜欢动手,热爱科学;

      分享的内容是“探究无线电力传输技术 — Wireless Power Transmission”。

      张峰源,加拿大11年级高中生在读;

      带来的分享主题是“软件逆向工程”。

      吴雨峻,目前就读于人大附中ICC高三AP;

      本次分享的主题是他在IMMC国际高中生数学建模比赛中的获奖研究“电子产品零售店应对抢购的装修和布局调整”。

      刘远心,对物理和历史有着同样热爱的高中生;

      带来分享的主题是“探究玻璃和琉璃的关系”。




      往期年会介绍


      集智俱乐部2019学术年会




      天使投资赞助和合作


      我们本次年会依然以定向邀请为主,预计参与人数在200人左右;活动主题是“因果纠缠”,同时也涵盖其他技术方面的主题,比如统计物理、深度学习、因果科学、图网络、人工智能等;我们的参会人员主要由研究学者、技术工程师/产品/运营、在科研中探索的硕士博士、社区内活跃的志愿者代表、公司创始人或者是投资人等组成。

      为了办好这场年会,我们诚挚邀请企业踊跃赞助,我们会努力满足您在招聘、品牌宣传、技术探讨、产学研对接等业务的需求,同时我们承诺,集智俱乐部作为一个非盈利的组织,您赞助的所有经费都将用于本次年会以及集智俱乐部的运营!

      如果您有合作意愿,请联系本次活动负责人王婷,洽谈详细合作事宜。

      联系方式如下:

      • wechat:wt1511181498

      • phone:18621066378




      点击“阅读原文”,查看年会详情及报名方式

      您可能也对以下帖子感兴趣

      文章有问题?点此查看未经处理的缓存